import pandas as pd
import matplotlib.pyplot as plt

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用黑体
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号

# 读取Excel文件
file_path = 'a2_updated.sheet'
data = pd.read_excel(r'C:\Users\程\PycharmProjects\pythonProject3\a2_updated.xlsx')


# 根据“实际控制人性质”分组并计算资产负债率的均值和方差
grouped = data.groupby('实际控制人性质')['资产负债率']
mean_values = grouped.mean()
variance_values = grouped.var()

# 打印资产负债率的均值和方差统计表
print("实际控制人性质分组的资产负债率均值和方差统计表：")
print(mean_values)
print(variance_values)

# 绘制年份和LSR的散点图和折线图
# 假设LSR已计算并添加到DataFrame中
# 如果您尚未计算LSR，请先计算并添加到DataFrame中
years = data['年份'].unique()
lsr_means = [data[data['年份'] == year]['LSR'].mean() for year in years]

plt.figure(figsize=(10, 5))
plt.scatter(years, lsr_means, color='blue')  # 散点图
plt.plot(years, lsr_means, color='red')     # 折线图
plt.title('年份与LSR均值')
plt.xlabel('年份')
plt.ylabel('LSR均值')
plt.grid(True)
plt.show()

# 根据行业代码大类绘制各行业的饼图
# 假设行业代码大类是以字母开头的
# 例如，行业代码以字母C开头表示所有制造业
industry_lsr = data.groupby('行业代码')['LSR'].sum()

plt.figure(figsize=(10, 7))
plt.pie(industry_lsr, labels=industry_lsr.index, autopct='%1.1f%%', startangle=140)
plt.title('行业LSR分布')
plt.show()
